李德毅院士:人工智能在奔跑
本文由海鹰资讯(ID:hiwing_news)授权转载
作者:中国工程院院士李德毅
8月18日,2016年海鹰论坛人工智能与无人装备发展在中国科技会堂成功举办。今天我们为大家奉上中国工程院院士李德毅在论坛上的讲稿。
李德毅院士,是指挥控制与人工智能领域专家,中国工程院院士,欧亚科学院院士,中国指挥与控制学会名誉理事长,中国人工智能学会理事长,国家信息化专家咨询委员会委员,军队战略规划咨询委员会委员,清华大学、国防大学兼职教授。长期从事云计算、云模型研究,出版《不确定性人工智能》等英文专著3本,获得国家发明专利8项,国家和军队级科技进步奖18项,发表学术论文180余篇,主编技术丛书7本。
本文是李德毅院士在题为《轮式机器人实践与展望》的专题报告中,对于人工智能60年、人工智能的典型案例及知识和数据双驱动的人工智能等方面的思考。我们进行了整理,未经作者本人审阅,略有改动。
人工智能60年
今年是人工智能诞生60年,1956年6月,在由十几位青年学者参与的达特茅斯暑期研讨会上诞生了 “人工智能”。六十年沧桑砥砺,一甲子春华秋实。我们格外怀念那些为人工智能做出过杰出贡献的科学家和工程师们。那一个个熠熠生辉的大师,一座座巍峨炫目的里程碑,人工智能已经长成枝繁叶茂的参天大树,正在对世界经济、人类生活和社会进步产生极其深刻的影响,我们更加充满前行的勇气,去拥抱人工智能的新时代。
今天60年过去了,为什么人工智能一下子火起来了?我认为首先是网络让人工智能火起来了,有了互联网就有了云计算,有了云计算就有了物联网,有了物联网就有了大数据,所以应该说是互联网、云计算、大数据成就了当今的人工智能。
人工智能到底有没有什么很大的发现,突然一天又做了多么惊天动地的事情呢?我们可以回顾一下历史,人类走过了农耕社会、工业社会、信息社会,现在有的学校还叫信息研究所,其实已经落后了,大家都知道这个时代光有信息的覆盖不够,智能作为当今社会时代印记的新的阶段叫智能社会已经得到了共识。我们曾经依靠资源、资本、劳动力等要素投入,支撑中国经济的快速增长和规模扩展,但这已经成为历史。加快从要素驱动发展向创新发展的转变,人工智能是一种解决方案。这件事情我们想过没有,不是靠资源,不是靠资本,不是靠劳动力,而是靠智能实现创新驱动。
我国将成为机器人最大的市场,机器人是制造业皇冠顶端的明珠,是国家科技创新和中高端制造业的重要标志。机器人革命是世界性的,时代性的,只有原创性的技术才能使我们成为机器人的产品和机器人市场规则的重要制定者和主导者。因此我们中国能不能成为人工智能市场重要规则的制定者或者主导者,这个是历史的机遇。机器人将成为人类社会走向智慧生活的重要伴侣,这将引发人人联网、物物联网的崭新形态,会改变人类的生产活动、经济活动和社会生活。这句话分量挺足,有哪一项技术能够改变人们的生产活动、经济活动、社会生活呢?人工智能走到了我们的面前,所以我们大家会有一个新的概念,不再是劳动力或原材料,也不再是传统制造,而是知识和智能,将成为先进社会最重要的经济来源,这就把智能的产业化推到了风口浪尖。
国家提出的智能制造,无论是人类智能,还是人工智能,都是在提升创新驱动发展源头的供给能力,这就是为什么所有学会都在研究人工智能,它是创新的原始驱动力量,是生产力中的核心生产力。最近我们跟科技部开了一个重要的会议,向中央提出了把《中国人工智能2030》作为国家《科技创新2030》重大专项,大家觉得这势在必行。另外,现在全国有30个学会,50所大学,100多位名教授,建议增设智能科学和技术为国家一级学科,我也认为势在必行。
当前人工智能的典型案例——围棋脑
关于人工智能的典型案例,我想用两个例子来讲一下,一个是围棋脑,一个是驾驶脑。
咱们先讲讲围棋,围棋这件事情反映了人工智能取得了怎样突飞猛进的进展。2011年,中国人工智能学会组织了九路围棋人机大战,北邮围棋程序Lingo对阵中国围棋总教练俞斌,他同时也是一个九段高手,当时我们预先商定俞斌让2子,那时的棋盘是9×9的棋盘,不是现在李世石下的19×19的棋盘。当时俞斌就说,你们机器人要我让两个子太狠了,最后我们北邮的Lingo程序战胜了俞斌。
当时舆论普遍认为“电脑9路盘围棋两三年或可抗衡人类,19路盘围棋,机器要战胜人类还看不到希望。”2011年这些科学家们预言,19路棋盘看不到希望,没想到5年之后变成了事实,为什么?
和计算机下围棋,难在哪里?
对我们搞人工智能或者搞数学的人来说,围棋跟象棋的根本差别是,象棋是越下子越小,最后以杀死大王为止。围棋想围住对方不是这个状态,子没有大小之分,目的就是谁把谁围住了就赢,这里面有手筋、弃子、劫争等很多战术,既要有逻辑思维,更要注重形象思维,它是更大局观的问题,因为本质上是一个拓扑学的问题,或者是拓扑动力学的问题,这个围棋还是很有意思的。
从统计的角度看,对一个特定的棋局态势,比如对于19×19路的棋盘,大概有250种可能的期望走法,沿某种走法深下去就可达150层,因此,共有250的150次方遍历搜索,计算和推理量巨大。围棋因其巨大的搜索空间和困难的棋局态势表达,被认为“千古无同局”,历来是人工智能的最大挑战。因此我们专门分别跟中国围棋协会、军事科学院和国防大学开了会,研讨李世石跟计算机下的这个棋。
大样本和自学习支撑AlphaGo取胜
最根本的我们认为AlphaGo胜,胜在哪里?胜在它突破了传统程序,搭建了两套模拟人类思维的深度卷积神经网络,第一个网叫value networks,它承载棋局态势评估,到底谁围住谁,当前的态势如何,这是一个网络评估的。我们知道战场上最需要的首先也是作战态势评估。那第二个网络,叫policy networks,它选择如何落子,这就是我们部队讲的决策,所以一个叫态势评估网,一个叫决策网,它们向人类棋手学习,从海量样本的胜局和败局中学习,并自动提取规则,进行推理。
从人工智能角度看人机大战,这是棋类高手与人工智能发展成果积累的对决,是让棋手充当测试员的一次科学试验而已,所以你让李世石下,他说跟机器人下没有感觉,这实际上是一个人和一群人的对决。在另一边,所有的程序员都是会下围棋的,所以他们既是棋类高手又是人工智能高手,就像我们现在做人工智能车一样,你既是经验驾驶员,又是做人工智能开车的,是一个生物人与“人与机器混合生物”之间的对决。所以要跨界创新,如果你光会下棋,不会人工智能肯定不行,你光会人工智能不会下棋肯定也不行,你要把围棋程序编好你不会下围棋肯定也不行,一个道理,无论是人机的象棋大战,还是人机的围棋大战,本质上都是人机跟机人的大战,一个是机器在前面,人在后面,一个是人在前面,机器在后面,所以说从长远来看,到底谁输谁赢,统计概率是50%和50%。
AlphaGo的局限性
我们看看AlphaGo有什么局限性,AlphaGo仅仅是一个围棋脑,确切来说它不是一个围棋手,因为他拿棋子的时候是靠人辅助去拿。他更不是一个围棋机器人,它没有眼和手,没有感知和行为能力,没有情绪,没有情感,不能分析对手的心理状态,不能现场和对手展开心理战,缺少交互认知能力。最近几年我对交互认知研究得稍微多一点,我在去年的合肥计算机大会上提出了这个问题,大家不要老是改变计算智能,计算认知,应该花一点精力研究交互智能,交互认知,26号我会在全国人工智能大会上加一个题目叫交互认知,希望大家能感兴趣。其实下棋就是典型的交互,是两个智能体之间的较量。
震撼之后的思考
AlphaGo这件事情我们可以提几个问题再思考一下,第一个问题,能不能让AlphaGo再下一次,你原来怎么下,你还怎么下,看看AlphaGo是不是能够重复。大家都知道我有一本书叫《不确定性人工智能》,我认为AlphaGo这个程序是很难重复的,每次都下得不一样,不会绝对一样的。
第二个问题,AlphaGo跟李世石下了5盘棋,下棋之后这个程序变了没有?如果是变了,变在哪里?如果没有变,就像我们手机程序一样重新启动一下,我们一般的程序是不变的,这起什么作用。
第三个问题,让相同版本或者不同版本的AlphaGo对弈一下,机器人和机器人下棋,结局会如何?首先跟樊麾下的时候是9版本,到了李世石下的是13版本,现在跟柯洁下的是AlphaGo的另外一个版本,所以版本在不断升级,尤其是中国,它的版本升级的速度比人类智能生活进化的速度要快的多。
第四个问题,如果让AlphaGo不再跟高手下,而是跟普通的棋手下,棋艺会不会退化?这些问题都值得我们考虑,我觉得机器人应该有学习的能力,如果我们今天做一个轮式机器人跟赛车手来一个比赛,人和人之间的比赛,有一个完整的感知认知和行为能力,不仅仅是AlphaGo的决策层面,这样的人机大战会更加激动人心。
当前人工智能的典型案例——驾驶脑
为什么要做智能驾驶
具体讲讲我们的驾驶脑,10年我搞了一个智能车,核心搞驾驶脑。汽车这个曾经被称之为改变了世界的机器,正在被人工智能所改变,正在被世界所改变。汽车至今实际上也就是100多年历史,看看百年汽车工业核心竞争力转移图。19世纪的时候,人们关注的是机械、传动、底盘、轮胎、结构,到20世纪的时候是被动安全、碳排放、发动机、能源,后来是开始考虑轻量化、主动安全、电动汽车、新能源,搞数字汽车,现在大家最感兴趣的是自动驾驶、自主驾驶和轮式机器人。
汽车给人类带来的福利还是很大的,但这同时也带来了严重的忧患,一人一车,一人多车,导致人类对自然资源的过度剥夺和过度消费,尤其是土地和资源,引发了一系列生态问题和社会问题,所以汽车是非要变革不可,不管你愿不愿意,汽车变成智能车都是必须的。另外从汽车造成的灾难来看,我国2010年交通事故死亡人数,公安部数据65225人,WHO模型估计275983人,相当每天一次重大空难,美国亦然,全球人类伤亡相当于每月一次911大灾难。所以车子不改革是不行的,站在科学理论角度上是不行的,我这有一句话,科学进步和人类文明不允许这个全球第一杀手。而且我们站在客观的情况看,在紧急情况下,人的本能难以保障安全,驾驶员失误不可避免,当然你盲驾不对,酒驾也不对,但是你不犯错误是不可能的,人是一定要犯错误的,人工智能将使得人工孤立驾驶机器的时代一去不复返,所以我们要做智能驾驶。
到2030年左右,80%了车辆都是自主行驶,偶尔的人工驾驶只是为了享受驾驶的乐趣而已,移动机器人将再次改变人类的生活形态。我们开始做轮式机器人,当然也有人说汽车不一定变成轮式机器人,汽车可以变成自动驾驶的终端,比如说地铁的火车,或者高铁的火车,它就是自动驾驶。所以汽车向前发展有两条路,一条路是自动驾驶加网络调度,用一个封闭的结构化条件让车自动驾驶。还有一种办法是用一个开放的非计划道路下,让它像人一样自主行驶。我们走的就是第二条,强调用人工智能技术代替驾驶员的感知,我们不是要代替汽车,不是做一个更好的汽车,我们要做代替驾驶员的功能,代替驾驶员的感知、认知和行为,确保车辆自主行驶。当然不必纠结机器驾驶脑或者驾驶员脑是否在微观上具有相似性,我们把它叫做认知的物理学方法,而不是认知的生物学方法,所以在我们看来,智能驾驶和汽车行业的说法不一样,即所谓最高级的自动驾驶就是全自动,我们不是这样划分的。
我们把智能驾驶等级区分为离线辅助驾驶,像ADAS、抬头显示、高德导航、碰撞预警。自动驾驶就是局部时段、局部区域自动驾驶。这两个本质上都是辅助驾驶,因为特斯拉要求自动驾驶的时候驾驶员必须把手放在方向盘上,有人说你这叫什么自动,你这叫随时干预,还是辅助,所以特斯拉改名叫自动辅助驾驶,可这个说法老百姓还是不饶他,你都辅助了还叫什么自动。
我们希望做的是自主驾驶或者没有驾驶员的驾驶,或者叫自驾驶,现在说的比较多的是机器自驾驶,为什么不叫无人驾驶?因为车里有人,无人驾驶就像无人机一样才叫无人,车里一般都有人的,所以科技部在发表“十三五”规划重大专项的时候提了一个新提法,叫做“以人为本的人机协同共驾”,我觉得这个说得比较好,人跟机器人要和谐相处,类似于骑士与马的关系,马是认知主体,马的前腿怎么跨,后腿怎么蹬,不需要你指挥给它发具体的操作指令,这是它的本能。我们希望将来人跟机器人能和谐相处,所以我把智能驾驶分五个等级,现在的自动驾驶本质上就辅助驾驶,还是人驾。
自动驾驶陷阱
但是车辆行驶过程中充满了不确定性,汽车如果是软件定义的机器自动驾驶的话,任何满足当前驾驶条件的自动驾驶窗口,无法知晓会维持多久,要随时随地准备切转到人工驾驶。因此,“自动驾驶”难以启动,它是一个陷阱。这句话一说要得罪很多人,我现在做一个案例给大家看看,假如说黄色小车是自动驾驶,只有两个红车是人工驾驶,自动驾驶按照他的窗口条件都符合自动驾驶,但是人驾的时候你不知道人怎么驾,所以人驾会干扰自动驾驶,预设的自动驾驶条件会很快崩溃,两个捣乱的车会把自动驾驶搞得一塌糊涂,你说自动驾驶好,不行,两个人捣乱就全完了。所以我认为自动驾驶是一个陷阱,在座的你们可能没有听说过这六个字——“自动驾驶陷阱”。
你们听到的只是自动驾驶,突然有一个人说这有问题,可能还是一个陷阱,为什么这么说,很简单,驾驶的作用哪去了,为什么开车要一个驾驶员,因为不管多好的车,自动化水平多么高,车辆行进中,驾驶员对道路环境变化和周边的流量不停地进行交互,用车的运动行为让周边车辆感知自身的存在,通过灯语、笛语,手势等和附近车辆、行人沟通,像在西方司机会客气地把手伸出来让你先走,这就是沟通,在中国有时候就是按喇叭快走。交互认知的结果转为对自身车辆的控制,交互认知的差异,反映个人智力和运动协调能力的差异。
如果搞自动驾驶,驾驶员在驾驶过程中,与环境和周边车辆的交互认知哪里去了?驾驶员的作用在自动驾驶中由谁来顶替,所以我就研究这个公式:
自主驾驶是不是等于若干个自动驾驶模式的叠加,假如i相当大,那亿万个自动驾驶模式就等于自主驾驶了吗?我们做自动泊车,上级提需求,自动泊车有4个模式,你赶紧做,做了一半不对又增加了4个模式,又说不对了有16个,现在又让我们做10万个自动泊车模式,10万个也不够,什么原因?第一个质疑,多少种自动驾驶模式才能够完全覆盖各种各样的驾驶场景?你家泊车怎么泊的呢?一半泊在马路牙子上面,一半在马路牙子下面,车道线也没有,我就这样泊了一辈子了,所以你要考虑泊车模式,因为老百姓经常这样做。第二个质疑,从一种自动驾驶模式转换到另外一种自动驾驶模式是唯一确定的吗?如果这两个条件不成立,那这个公式就不成立。
三类传感器通道
智能车研发的困难,不仅仅是汽车动力学的性质和各种各样的传感器要求,更重要的是研发和驾驶员一样在线的机器驾驶脑,模拟实现人在回路中自主预测和控制,应对车辆行驶中的不确定性,所以我给车厂减负,我说把人在回路中的自主驾驶让车厂去模拟是难以承受的,把机器驾驶脑的研发让车厂去做是难以承受之重。
于是我们就在车上加了一个感知和认知的装备,在已有认知的协助下,类比人的视觉通道,把它分成三大类传感器,一个叫GPS+IMU通道,一个叫雷达通道,一个叫图像通道,这三个通道各负其责,又只能尽力而为,形成视觉残留,那它们分别做什么?第一做定位,第二做路权检测,第三做导航。定位就是我在什么地方,你拿GPS绝对定位,你拿雷达图像可以相对定位,路权检测就是周边我有多大的路权够我用,导航就是下一步怎么走。从技术上讲,第一个叫SLAM,第二叫路权,第三叫认知箭头,我们都把它形式化。
做强什么?我们可以做图像处理,比如先视后觉,这个叫常规的带GPU加速的计算机图像处理。我们也要做视而不觉,边视边觉或者先觉后视。我们有一句话,“路边的美女不要看”,开车没有那个闲心,驾驶脑不看,它对周边自然风景、建筑风格、行人年龄姿态行为、是不是美女、行人和宠物的差别、前方车辆品牌,是不是时尚等等,没有兴趣,只要是移动单位我都不能碰。所以有的东西要视而不觉,有的东西要边视边觉,有的是先觉后视,我头脑中有几个事故场景,看看是不是这样的,我就拿已有的认知帮助当前的感知,这很重要,所以就出来我们驾驶脑的第一张图。
第一张图叫驾驶脑数据流程图,这个图是有点含金量的,大家知道人脑的记忆是完全不同于计算机的存储,人脑里至少有三个记忆区,一个叫瞬间记忆,一个叫工作记忆,还有一个叫场景记忆。我们利用瞬间记忆来感知图像、雷达给我们带来的丰富的典型信息,但是我们用驾驶态势感知之前的可用路权,我们用认知箭头体现我们的方向盘、油门和刹车的操作,这个时候我们做了形式化,这张图构成了我们驾驶脑的基本状态,体现了不同记忆区在过程当中的反馈,以及人脑在长期记忆、短期记忆、工作记忆之间的相互关系,因此在我们的驾驶脑里面有路口记忆、事故记忆、险情记忆等等。
这次特斯拉并没有识别出掩映在蓝天白云下的白色大卡车,发生了事故,如果这个事故在我们这里面叫一个事故场景的话,可以把这个场景复制到我们的驾驶脑里面去,如果所有的机器人都有这个事故记忆的话,再也不会发生这样的事,这就是机器驾驶脑的作用。真正能教机器人开车的应该是驾驶员,有经验的驾驶员长期与车互动,熟练到已经把车同化为人体的一部分,成为与身体无缝对接的真实外延,因此机器驾驶脑在驾驶员开车时应该能“悄悄地”自学习,将“脑和机器融合在一起”。我们将调试总线扩展为自学习总线,开创自学习板块,完成统计学习和进化学习,让轮式机器人像人一样开车。一旦当前的认知与过去经历的记忆进行了混合比对,驾驶脑便能对不确定未来做出合适的决策,完成大脑的创造性、运动的灵巧性以及对车无穷无尽的同化过程。
正学习和负学习
我们目前的驾驶脑有两个网络,第一个叫驾驶态势,第二个叫决策网络,你看我们的需求网络是这样做的:人工驾驶的时候,3路机器视觉依然起作用,经过形式化把它变成当前的驾驶态势,而驾驶员对当前态势甚至对方向盘、油门或者刹车的动作,我把它抽象成认知箭头,当前的驾驶态势和这个认知箭头就组成一个图对库,这个图对就是驾驶态势—认知图对。假如说首都机场到天安门一小时,每小时36公里,那么我们叫3万6千的态势图,100秒控制一次方向盘,一秒钟控制十次方向盘就足够了,这样我们就一天得到153924帧图对,于是我们拿神经网络学习形成一个驾驶记忆棒,这个驾驶记忆棒以前我们把它叫做知识库,现在它不是抽象的知识。你也可以把驾驶态势图看作一个人脸,把操作箭头看作是一个标签,下一次开车,驾驶员不在了,自驾驶,3路视觉仍然可以得到驾驶态势图,拿这个驾驶态势图到搜索引擎里找跟这个驾驶态势图靠近的箭头是什么样的,拿这个箭头来开车,这个就是我们驾驶脑里面的方案。
人开车拿驾照和积累驾驶经验的这个过程是非常宝贵的,真正的驾驶经验积累往往是在错误中学习,在事故中学习,所以我们还有一个负学习,在这样的驾驶员操作情况下,曾经发生的事故我们通过深度学习形成一个事故记忆,下一次机器人再遇到这样情况的时候,是万万不可以用人犯的错误来进行处置的,这个叫负面学习,也是我们的创意所在。
我们的创新
当今,深度学习正站在全球人工智能的风口,普遍把卷积神经网用于点云图像识别、完成感知阶段的自学习,而我们另辟蹊径,把卷积神经网络用于形式化之后的、基于可用路权的驾驶态势图和反映驾驶操作全部内容的认知箭头形成的图对上,用于认知阶段的深度学习,大大减少、简化了实时处理的数据量。驾驶脑成功的关键是驾驶认知的形式化,以及形式化后的自学习,是把瞬间记忆的大数据“缩水”,即“感知理解”之后,一直到认知阶段进行工作记忆区的迁移学习。
驾驶脑的定位
当然我们还可以通过网络设立云感知、云导航、云认知、云学习、云交互。回顾近十年,我们参加的比赛和里程碑实验,智能车各种感知和认知手段,相互依存,彼此缠绕。在各类比赛场、测试场,智能车表现千奇百怪、反反复复,我们困惑过,迷茫过,试来试去,换车、换平台、加电源、换模块,通过多车交叉验证和常态试验,最近3年终于理出了头绪,形成全新的驾驶脑设计。我们的驾驶脑将来还是很有意思的,它跟工厂的车是不矛盾的,不是抢工厂的饭碗。第一,我们的驾驶脑是拿“驾照”的,安了驾驶脑,车子就可以跑了,可以给你一个驾照,这个是车厂替代不了的,你的产业化链条有足够的地位才可以存在,我们终于找到了定位。
第二,我们卖“驾龄”的,驾驶经验可以放到这里面,驾照替代不了,想想刚拿了驾照跟开了10年的车差别是很大的。
第三个很重要,我们买个“路熟”,人人都可以买一张地图,但不等于会开车,你必须自己走过这条路才清楚。所以我在《环球时报》上写了一篇文章倡导对人工智能要有一颗敬畏之心,因为它把地图默化到你这个上面来,比你人熟悉地图要快得多,我只要把这个驾驶脑引过来就可以了,地图替代不了。
第四,我们是个性化驾驶,或者标杆驾驶。我们现在就想做一个1路车的标杆驾驶,大家都知道北京1路车就在长安街来回跑,有的司机一辈子就开这个路线,他开得很好,我们把他的标杆驾驶放进去,就变成了标杆驾驶。
知识和数据双驱动的人工智能
最后讲一讲,我认为当前知识和数据双驱动的人工智能,尤其值得我们关注。
以图灵模型构造的冯.诺依曼计算机是很伟大的,实现了计算智能,甚至超过了人的计算能力。但它给我们的只是计算、存储、交互三者分离的,导致内存不同区域、以及硬盘和内存间的数据频繁访问,成为耗能大的根本原因。而脑认知的构成单元同时具有记忆智能、计算智能和交互智能,在架构中没有得到体现。人类通过交互、记忆和计算获得认知。在过去的半个世纪里我们是否太多地关注了计算智能,忽视了交互智能和记忆智能?认知主体是自身进行的计算,本质是思维。从计算科学的角度讲,计算的本质是思维,从认知的科学角度看,认知的本质就是计算,计算很重要,但是记忆认知也很重要,特别是不同记忆区的不同形状和方法。
1950年图灵提出一个图灵测试,检验是不是智能,这个如果区别开来的话,本来只是一个交互智能测试,所以我们应该研究人是如何听、说、看的,如何体觉交互的,这个很重要,因此我把智能分成记忆智能、计算智能和交互智能。而图像是认知的主体,深度学习在图像认知中得到了广泛应用,但是记忆不等于存储,感知不等于认知,就像英语里说的,looking≠seeing,touch≠feeling。我们构造了不同尺度连接组的、三位一体的、多个层次的认知网络。
深度学习的局限性
深度学习我们也可以对它进行一点批判,这个卷积神经网络,有时候很好,有时候也很糟糕,太多的学习参数具有随意性,不能保证算法的收敛性,缺少反馈机制,大量案例也不具有累积性,这个案例跟那个案例没有协和关系,不像我们人类认知过程。深度学习不可能是人工智能的终结者。
深度学习和规则程序的巨大差别是学习结果不具有可解释性,它可以这样干,但为什么它不知道,传统编程仍然起着搭建“脚手架”的作用,学习的过程,尤其是人工神经网络中的参数的冻结过程不透明,学习的结果只知道是什么,不知道为什么。你的车子为什么开得这么好?它答不出来。如果我们从软件工程的观点,软件=程序+数据+文档,文档是带有语意的数据,归档到底还是程序,程序哪来的?程序的上位就是算法,算法的上位就是模型,模型的上位就是形式化约束。
知识、数据双驱动的人工智能
所以我们习惯于数据围着程序转,尤其是我们编码的人,我们就想管理的是程序、管理的算法,管理的模型,今天情况发生了一些变化,我们不单单从知识驱动的形式化约束向下看模型,向下看算法,最后变成程序,我们还要习惯用数据定义的程序,卷积神经网络诸多的权重就是数据定义的,就是一个案例。由上而下的知识驱动,早先给出的形式化约束较为宽松,由此形成的“脚手架”,我们可以把它叫做模型和算法,比较宽泛,在依据算法实现的程序中,会存在有很多可选参数和可选代码段;而在由下而上的数据驱动过程中,这样的程序可以通过大数据的训练和学习被精细化调教,多次迭代,使得这些参数逐步冻结或优化,部分代码将会被修改。
这样一来就形成了知识、数据双驱动的人工智能,今天机器人通过大样本和深度学习,终于可以聪明到足以改写程序中的参变量,甚至自身的局部代码。人工智能的核心不仅仅是算法,更是学习,大数据环境下充分发挥碎片化大数据认知的机理,克服宏观认知的形式化困难,细分约束区间,通过大量微观认知的形式化,降低形式化难度,缩小在线推理范围,生成数据定义的软件,让程序围着数据转,这个是我们要关注的。
愿景
我们可以想想,在我们的星球上,围棋和汽车将会变成机器人,它们有智慧、个性有行为能力,甚至还有情感,最后这句是我讲的,不一定对。机器人给人类带来的影响,将远远超过计算机和互联网在过去几十年间已经对世界造成的改变,像我们这代人计算机和互联网的改变是印象非常深刻的,我大胆预言一下,机器人的改变比这个还会更大。
到2030年,争取我国每万名产业工人所拥有的工业机器人数量要达到300台左右;农村城镇化导致中国农民急剧减少,无人拖拉机、农用无人机、背包机器人和收割机器人将成为新一代“农民”,黄牛退休、铁牛耕地、农民进城、专家种田;全国大中医院的微创手术机器人近一半国产化。在全社会普及使用形形色色的服务机器人中,我国家家都会有机器人,老年人、残疾人和儿童平均每人拥有一台形态各异的服务机器人,这个还是可以做到的。
人类的发展史,就是人类学会运用工具、制造工具和发明机器的历史,机器使得人类更强大。人类正在发明越来越多的机器人,智能手机可以成为你的忠实助理,轮式机器人也会比一般人开车开得更好。曾经的很多工作岗位将会被智能机器人替代,但同时又自然会涌现出更多新的工作,人类将更加尊严、优雅、智慧地生活! 这才是我们所希望的。
人类始终善于更好的调教和帮助机器人,善于利用机器人的优势并弥补机器人的不足,或者用新的机器人淘汰旧的机器人;反过来,人类还能够利用机器人提升自身的智慧和能力,机器人一定会让人类自身更智能。各式各样人机协同的机器人,为我们迎来了人与机器人共舞的新时代,伴随优雅的舞曲,毋庸置疑人类始终是领舞者,谢谢大家。